Stan badań na 2022-08-31
Górka 12 wpisów jest z dnia 2022-04-23 `
## date_user volunteer_id n
## 1 2022-04-23 alex1313 9
## 2 2022-04-23 hpruszyn 2
## 3 2022-04-23 tomektramwaj 1
## TODO Liczba zdjęć w czasie i na ochotnika?
Łącznie wpisy na mapę dzikich wysypisk przesłały 56 osoby.
Wszystkie nazwy ochotników ujednoliciłem do małych liter. Usunąłem spacje na początku i na końcu nazw. To pozwoliło liczyć nazwy wpisane np. “sebastian33444” i “Sebastian33444” jako to samo.
Nazwy moje (Remka) są dwie: Rmo i Uffo7. Wcześniej korzystałem z Uffo7, potem na potrzeby nagrywania instrukcji wymyśliłem inną nazwę aby pokazać w formularzu ścieżkę przesyłania wpisu po raz pierwszy.
| volunteer_id | n |
|---|---|
| katarzyna wasilewska | 16 |
| pkrupnik | 16 |
| rmo | 16 |
| alex1313 | 14 |
| hpruszyn | 14 |
| kraterek | 14 |
| email_dzikiewysypiska | 11 |
| ezamar | 10 |
| ktk | 8 |
| anna_krzynowek | 5 |
| darkerone | 5 |
| langel | 5 |
| kacperka | 4 |
| uffo7 | 4 |
| jul_woj | 3 |
| kolija | 3 |
| quks | 3 |
| radkel | 3 |
| sebastian33444 | 3 |
| taranah | 3 |
| twardy | 3 |
| zwiedzamłódź | 3 |
| alex | 2 |
| efem | 2 |
| gargl | 2 |
| maciej | 2 |
| ms1996 | 2 |
| radosław antosik | 2 |
| sidi | 2 |
| tooomasz | 2 |
| ainka | 1 |
| alexxx19 | 1 |
| atom | 1 |
| bogusia | 1 |
| dim79 | 1 |
| j13 | 1 |
| jerzy1956 | 1 |
| jmp | 1 |
| juha | 1 |
| juliaróża | 1 |
| juliaz | 1 |
| kacperka1 | 1 |
| kasia chojnacka | 1 |
| katarzyna | 1 |
| magpas | 1 |
| małgo | 1 |
| małgorzata | 1 |
| nittka969 | 1 |
| noyes | 1 |
| nukazet | 1 |
| ps | 1 |
| romek1076 | 1 |
| sejti | 1 |
| sierra | 1 |
| tomektramwaj | 1 |
| ula urszula | 1 |
Mamy dużo osób, które zrobiły mało wpisów, a mało takich które zrobiły dużo.
To jest też typowe np. w użytkowaniu mediów społecznościowych (mało osób ma wysoką aktywność a dużą ma małą).
| liczba_wpis | liczba_ochotnik |
|---|---|
| 1 | 26 |
| 2 | 8 |
| 3 | 8 |
| 4 | 2 |
| 5 | 3 |
| 8 | 1 |
| 10 | 1 |
| 11 | 1 |
| 14 | 3 |
| 16 | 3 |
Zobaczymy jeszcze, czy ilość wpisów jest powiązana z tym, jak długo ochotnik jest z nami. Biorę datę zatwierdzaną przez ochotnika.
Liczę różnicę dat jako ostatnia_data - pierwsza_data + 1. Czyli 1 dzień oznacza, że ochotnik przesłał wpisy tylko jednego dnia.
| volunteer_id | liczba_wpis | pierwszy_ostatni_wpis_ile_dni |
|---|---|---|
| katarzyna wasilewska | 16 | 96 |
| pkrupnik | 16 | 134 |
| rmo | 16 | 137 |
| alex1313 | 14 | 84 |
| hpruszyn | 14 | 11 |
| kraterek | 14 | 143 |
| email_dzikiewysypiska | 11 | 49 |
| ezamar | 10 | 160 |
| ktk | 8 | 101 |
| anna_krzynowek | 5 | 7 |
| darkerone | 5 | 44 |
| langel | 5 | 2 |
| kacperka | 4 | 5 |
| uffo7 | 4 | 28 |
| jul_woj | 3 | 99 |
| kolija | 3 | 1 |
| quks | 3 | 1 |
| radkel | 3 | 1 |
| sebastian33444 | 3 | 109 |
| taranah | 3 | 24 |
| twardy | 3 | 2 |
| zwiedzamłódź | 3 | 1 |
| alex | 2 | 26 |
| efem | 2 | 4 |
| gargl | 2 | 19 |
| maciej | 2 | 19 |
| ms1996 | 2 | 1 |
| radosław antosik | 2 | 1 |
| sidi | 2 | 1 |
| tooomasz | 2 | 1 |
| ainka | 1 | 1 |
| alexxx19 | 1 | 1 |
| atom | 1 | 1 |
| bogusia | 1 | 1 |
| dim79 | 1 | 1 |
| j13 | 1 | 1 |
| jerzy1956 | 1 | 1 |
| jmp | 1 | 1 |
| juha | 1 | 1 |
| juliaróża | 1 | 1 |
| juliaz | 1 | 1 |
| kacperka1 | 1 | 1 |
| kasia chojnacka | 1 | 1 |
| katarzyna | 1 | 1 |
| magpas | 1 | 1 |
| małgo | 1 | 1 |
| małgorzata | 1 | 1 |
| nittka969 | 1 | 1 |
| noyes | 1 | 1 |
| nukazet | 1 | 1 |
| ps | 1 | 1 |
| romek1076 | 1 | 1 |
| sejti | 1 | 1 |
| sierra | 1 | 1 |
| tomektramwaj | 1 | 1 |
| ula urszula | 1 | 1 |
Na wykresie trochę widać zależność monotoniczną – jak rośnie jedno to drugie też. Jest przy tym dużo pojedynczych wpisów.
Skala logarytmiczna żeby “rozciągnąć” niskie wartości, których jest większość:
Zobaczmy to z trendem i nazwami ochotników:
Zobaczmy to samo ale tylko dla tych, co mają więcej, niż 1 wpis:
Ci co są dłużej niż 10 dni mają więcej wpisów?
To są nierówne grupy. Tych, co są dłużej mamy znacznie mniej.
## pierwszy_ostatni_wpis_ile_dni > 10
## FALSE TRUE
## 39 17
##
## Spearman's rank correlation rho
##
## data: volunt_difftime$pierwszy_ostatni_wpis_ile_dni and volunt_difftime$liczba_wpis
## S = 4891.3, p-value = 1.735e-15
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.8328324
Korelacja wychodzi 0.8328324 czyli tak, im dłużej ochotnik jest z nami tym ma więcej wpisów.
Może najsensowniej byłoby to policzyć tylko dla osób, mających więcej, niż 1 wpis bo takie z 1 wpisem mają zawsze 1 dzień?
##
## Spearman's rank correlation rho
##
## data: volunt_difftime_1$pierwszy_ostatni_wpis_ile_dni and volunt_difftime_1$liczba_wpis
## S = 1581.8, p-value = 0.0001077
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.6480953
Tutaj współczynnik jest niższy, niż kiedy braliśmy wszystkich.
Jeden punkt na mapie oznacza jeden wpis. Łącznie 196 punkty, 94% z 208 wpisów.
| Podano informację o wysypisku | n | % |
|---|---|---|
| Nie | 144 | 69 |
| Tak | 64 | 31 |
| SUMA | 208 | 100 |
O ile nie wskazano inaczej, cechy wysypisk dotyczą 64 wpisów.
Czy podanie informacji o wysypisku zależy od tego, kto robi wpis? Czy zależy od tego, który jest to kolejny wpis?
Są osoby zawsze wpisujące informacje, są takie, które tego nie robią. Jak to wyjaśnić? Nie wiem, czy mamy coś sensownego w danych na ten temat.
Może sama liczba wpisów?
Nie widzę zależności.
Też nic nie widać.
Jeszcze zobaczymy frakcję “tak” w zależności od pogrupowanej liczby wpisów
##
## FALSE TRUE
## 34 22
## volunteer_id Nie Tak liczba_wpis_sum
## Length:56 Min. : 0.000 Min. :0.000 Min. : 1.000
## Class :character 1st Qu.: 0.000 1st Qu.:0.000 1st Qu.: 1.000
## Mode :character Median : 1.000 Median :1.000 Median : 2.000
## Mean : 2.571 Mean :1.143 Mean : 3.714
## 3rd Qu.: 2.250 3rd Qu.:1.000 3rd Qu.: 3.250
## Max. :15.000 Max. :6.000 Max. :16.000
## frc_tak
## Min. :0.0000
## 1st Qu.:0.0000
## Median :0.0625
## Mean :0.3780
## 3rd Qu.:1.0000
## Max. :1.0000
Nie widzę zależności i jest to mało intuicyjne.
TODO - potraktować wpisy jako sekwencję po dacie, pierwszy, drugi itp. spróbować na tym to sprawdzić
Najpierw zajmiemy się kategorią najbardziej problematyczną, “większe niż 501 mkw”
| title | volunteer_id | 10_Jak_oceniasz_powi | longitude | latitude |
|---|---|---|---|---|
| 05/05/2022 17:57:13 | rmo | większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie | 19.47665 | 51.76821 |
| 16/04/2022 12:21:04 sebastian33444 | sebastian33444 | większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie | 19.58722 | 51.74731 |
| 27/03/2022 19:24:39 | anna_krzynowek | większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie | NA | NA |
| 25/03/2022 17:11:19 Juha | juha | większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie | 19.45078 | 51.79422 |
| 21/03/2022 22:49:31 | anna_krzynowek | większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie | NA | NA |
| 10/03/2022 12:52:12 Pkrupnik | pkrupnik | większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie | 19.44127 | 51.77815 |
Mamy 6 wpisów w tej kategorii o największej powierzchni. Geolokalizację mają 4 punkty. Zobaczmy je na mapie:
TODO: pokazać każdy punkt z bliska wraz z ulicami i ich nazwami
Zobaczmy sobie jakie zdjęcia zostały zrobione:
10/03/2022 12:52:12 Pkrupnik - zdjęcie 1.
10/03/2022 12:52:12 Pkrupnik - zdjęcie 2.
10/03/2022 12:52:12 Pkrupnik - zdjęcie 3.
10/03/2022 12:52:12 Pkrupnik - zdjęcie 4.
25/03/2022 17:11:19 Juha - zdjęcie 1.
25/03/2022 17:11:19 Juha - zdjęcie 2.
25/03/2022 17:11:19 Juha - zdjęcie 3.
25/03/2022 17:11:19 Juha - zdjęcie 4.
16/04/2022 12:21:04 sebastian33444 - zdjęcie 1.
To zdjęcie jest „puste”, zastąpione grafiką z logo E5. Powstaje to kiedy osoba zrobiła zdjęcie ale nie wysłała go na serwer E5.
05/05/2022 17:57:13 - zdjęcie 1.
05/05/2022 17:57:13 - zdjęcie 2.
05/05/2022 17:57:13 - zdjęcie 3.
To ostatnie to wpis mój (Remka) - nick rmo.
Na marginesie dowiedziałem się od mojej żony Oli, że w geografii poprawnie jest teren zieleni, a nie zielony.
| Jaki_jest_charakt | Jak_oceniasz_powi | Total | ||||
|---|---|---|---|---|---|---|
|
do 5 metrów kwadratowych (m. kw) - mniejsze niż mały pokój |
od 51 do 500 m. kw - mieszkanie lub boisko do koszykówki |
od 6 do 50 m. kw - pokój lub kilka pokoi |
trudno powiedzieć |
większe niż 501 m. kw - plac Dąbrowskiego, boisko piłkarskie |
||
|
drobne odpady rozproszone |
5 | 6 | 6 | 0 | 0 | 17 |
| inne | 2 | 0 | 3 | 0 | 3 | 8 |
| kilka stosów | 3 | 7 | 7 | 0 | 1 | 18 |
|
pojedyncze duże gabaryty (np. muszla klozetowa, lodówka) |
4 | 1 | 1 | 1 | 1 | 8 |
| zwarty stos odpadów | 9 | 0 | 3 | 0 | 1 | 13 |
| Total | 23 | 14 | 20 | 1 | 6 | 64 | χ2=32.924 · df=16 · Cramer’s V=0.359 · Fisher’s p=0.008 |
Wyróżnia się to, że “zwarty stos odpadów” występuje przy powierzchni “do 5 mkw”. Mamy 9 takich wpisów. “Kilka stosów” to najczęściej “6 do 50 mkw” lub “51 do 500 mkw”, mamy po 7 takich wpisów.
Widać też, że przy “drobnych odpadach rozproszonych” nie było wskazań na największą powierzchnię “większe niż 501 mkw”.
Wykres pokazuje te same liczby. Ogólnie jest dość duża zmienność.
Pytanie wielokrotnego wyboru, odpowiedzi nie sumują się do 50 wpisów.
Dopiero w lipcu pojawiło się wskazanie, że wysypisko jest “niewidoczne (ukryte)”.
| title | volunteer_id | 16_Czy_znalezione_wy |
|---|---|---|
| 14/07/2022 19:16:28 | alex1313 | Niewidoczne (ukryte) |